智能论文笔记

Self-Training of Halfspaces with Generalization Guarantees under Massart Mislabeling Noise Model

Lies Hadjadj , Massih Reza-Amini , Sana Louhichi , Alexis Deschamps

分类：机器学习 | (统计)机器学习

2021-11-29

我们调查了半个空间自训算法的泛化特性。该方法从标记和未标记的培训数据中迭代地了解半个空间列表，其中每个迭代包括两个步骤：探索和修剪。在探索阶段中，通过在未标记的示例中最大化未符号余量，然后将伪标签分配给具有高于当前阈值的距离的距离来顺序地找到半空间。然后将伪标记的示例添加到训练集中，并且学习了一个新的分类器。重复该过程，直到不再是未标记的示例仍然用于伪标记。在修剪阶段，然后丢弃与距离相关的未签名边缘大于相关的余量的距离的伪标记的样本。我们证明了由此产生的分类序列的错误分类误差被界定，并表明由此产生的半导体方法与仅使用初始标记的训练集学习的分类器相比，从未降低性能。与最先进的方法相比，在各种基准上进行的实验证明了所提出的方法的效率。

translated by 谷歌翻译

气候变化增加了损害电力系统可靠性并导致多次设备故障的极端天气事件（风暴，大雨，野火）的数量。实时和准确检测潜在线路故障是减轻极端天气影响并激活紧急控制的第一步。功率平衡方程非线性，极端事件中的发电不确定性增加，缺乏电网可观察性会损害传统数据驱动的失败检测方法的效率。同时，基于神经网络的现代化的机器学习方法需要大量数据来检测事故，尤其是在改变时间的环境中。本文提出了一个具有物理信息的线路故障检测器（字段），该探测器利用网格拓扑信息来减少样本和时间复杂性并提高定位准确性。最后，我们说明了与最先进的方法相比，与各种测试用例相比，我们的方法的优越性实证性能。

translated by 谷歌翻译